CORPUS (linguistique)

CORPUS (linguistique)
CORPUS (linguistique)

CORPUS, linguistique

Ensemble homogène et significatif de données linguistiques observées et à partir desquelles pourra s’élaborer la théorie. La notion de corpus est évidemment fondamentale dans la linguistique structurale: désireuse de substituer à la normativité de la grammaire ou aux fondements pseudo-logiques de la signification un enregistrement de l’usage, écrit ou oral, ainsi qu’un relevé des différences en fonction des différents contextes, elle pose en principe l’absolue nécessité de s’appuyer sur des productions de parole. Les caractéristiques d’un corpus significatif sont: l’homogénéité (le groupe qui le produit est socialement défini), la synchronie (on ne peut travailler sur des énoncés trop éloignés chronologiquement les uns des autres), la moindre redondance possible (on supprimera des énoncés représentatifs d’un phénomène identique). Nanti de son matériau, le linguiste distributionnaliste induira, par l’intermédiaire d’une formalisation des contextes et en s’appuyant sur l’hypothèse des deux axes de fonctionnement (paradigmatique et syntagmatique), les lois du code. La notion de corpus prête le flanc à une critique néanmoins sérieuse: notamment, dans le modèle de langage impliqué par le recours à l’échantillon, on ne peut que rester en deçà de la perspective créative par laquelle le sujet est capable de produire aussi bien que de comprendre un nombre infini d’énoncés qui ne figurent pas dans le corpus. Il faut alors reconnaître la fragilité d’une observation inductive comparée aux théories hypothético-déductives capables d’intégrer cette créativité. On est alors conduit à renoncer au corpus pour le remplacer par l’épreuve de grammaticalité auprès d’un locuteur natif.

Encyclopédie Universelle. 2012.

Игры ⚽ Нужно решить контрольную?

Regardez d'autres dictionnaires:

  • corpus — [ kɔrpys ] n. m. • 1863; « hostie » fin XIIe; mot lat. « corps » 1 ♦ Dr. Recueil de pièces, de documents concernant une même discipline. Corpus d inscriptions latines et grecques. 2 ♦ (1961) Ling. Ensemble fini d énoncés réels réuni en vue de l… …   Encyclopédie Universelle

  • Corpus oraux — Corpus oral En linguistique, un corpus oral est un corpus constitué de transcriptions de données orales. Bibliographie Olivier Baude, Corpus oraux. Guide des bonnes pratiques, Paris, CNRS, 2006 Douglas Biber, Variation across speech and writing,… …   Wikipédia en Français

  • LINGUISTIQUE ET LITTÉRATURE — La rupture de l’unité ancienne entre «grammaire» et «belles lettres», instituée par le passage de la philologie à la linguistique, a conduit à poser comme un problème la question de la relation entre la linguistique et la littérature. Les… …   Encyclopédie Universelle

  • Linguistique Générative — La linguistique générative regroupe un ensemble de théories développées à partir des années 1950 par le linguiste américain Noam Chomsky. Elle s oppose à la fois au béhaviorisme et au structuralisme. La théorie générative se distingue des autres… …   Wikipédia en Français

  • Linguistique generative — Linguistique générative La linguistique générative regroupe un ensemble de théories développées à partir des années 1950 par le linguiste américain Noam Chomsky. Elle s oppose à la fois au béhaviorisme et au structuralisme. La théorie générative… …   Wikipédia en Français

  • Linguistique Informatique — La linguistique informatique (ou informatique linguistique) est un champ d étude interdisciplinaire qui étudie le traitement automatique des langages naturels. Avec l évolution rapide des technologies informatiques, le besoin s est rapidement… …   Wikipédia en Français

  • Linguistique computationnelle — Linguistique informatique La linguistique informatique (ou informatique linguistique) est un champ d étude interdisciplinaire qui étudie le traitement automatique des langages naturels. Avec l évolution rapide des technologies informatiques, le… …   Wikipédia en Français

  • Corpus — Pour les articles homonymes, voir Corpus (homonymie) et Corps. Un corpus est un ensemble de documents, artistiques ou non (textes, images, vidéos, etc.), regroupés dans une optique précise. On peut utiliser des corpus dans plusieurs… …   Wikipédia en Français

  • Corpus oral — En linguistique, un corpus oral est un corpus constitué de transcriptions de données orales. Bibliographie Olivier Baude, Corpus oraux. Guide des bonnes pratiques, Paris, CNRS, 2006 Douglas Biber, Variation across speech and writing, Cambridge,… …   Wikipédia en Français

  • Corpus (revue) — Pour les articles homonymes, voir Corpus (homonymie). Corpus Pays  France Langue français …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”